« Pour commencer, pourriez-vous définir 'données de la recherche' ? » Une tentative de réponse

نویسندگان

  • Joachim Schöpfel
  • Éric Kergosien
  • Hélène Prost
چکیده

RESUME. Le projet D4Humanities s’inscrit dans le champ des Humanités numériques – comment permettre l’exploration des données de la recherche en SHS (corpus textuels ou oraux, données brutes, images...) avec des techniques numériques (text and data mining, cartographie, visualisation...) afin de construire un sens nouveau ? Il s’inscrit dans la continuité des travaux du laboratoire GERiiCO et de ses partenaires à l’Université de Lille Sciences Humaines et Sociales (SCD, ED SHS, ANRT...) avec comme objectif d’accélérer la démarche des données de la recherche notamment par rapport aux doctorants et jeunes chercheurs, et de faciliter le montage d’un projet de recherche international. En particulier, le projet contient trois volets : (1) Pratiques et besoins dans le domaine des données de la recherche (enquête qualitative des comportements, attitudes, motivations et besoins par rapport à la gestion et au partage des données de la recherche) ; (2) workflow pour le dépôt des données des doctorants en SHS (dépôt, préservation et diffusion des données via le service NAKALA de la TGIR Huma-Num) ; (3) recherche sur les données et les thèses (concept et typologie des données en SHS ; évolution des contenus, formats, structures et prescriptions des thèses dans l’environnement de l’Open Science). Le projet sera mené avec l’ISN Oldenburg et d’autres partenaires étrangers ; il facilitera la création d’un consortium et le montage d’un projet de recherche dans les Humanités numériques sur les thèses de doctorat de l’avenir, avec un financement européen (H2020) ou franco-allemand (ANR/DFG). Cette communication présente les grandes lignes de l’étude sur les données de l’axe 3, c’est-à-dire l’analyse du concept de données de la recherche, pour mieux cerner l’identification (granularité), pour mieux comprendre la distinction et les relations entre données primaires et secondaires et pour affiner la catégorisation des données en SHS. L’accent est mis sur une triple approche, conceptuelle, typologique et fonctionnelle.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Utilisation de l'analyse factorielle des correspondances pour la recherche d'images à grande échelle

Résumé. Nous nous intéressons à l’utilisation de l’Analyse Factorielle des Correspondances (AFC) pour la recherche d’images par le contenu dans une base de données d’images volumineuse. Nous adaptons l’AFC, méthode originellement développée pour l’Analyse des Données Textuelles (ADT), aux images en utilisant des descripteurs locaux SIFT. En ADT, l’AFC permet de réduire le nombre de dimensions e...

متن کامل

Évolution de schémas dans les entrepôts de données : modèle à base de règles

La mise en œuvre d’un entrepôt de données nécessite un important travail d’étude de l’existant et de recueil de données pour bien traiter les besoins d’analyses. Hors, il est impossible de définir de façon exhaustive ces besoins pour l’ensemble des utilisateurs. La prise en compte de nouveaux besoins d’analyses nécessite l’évolution du schéma de l’entrepôt de données. Deux alternatives existent...

متن کامل

Recherche d'information multimédia : Apport de la fouille de données et des ontologies

Résumé. A ce jour, le média image est omniprésent dans de nombreuses applications. Un volume de données considérable est produit ce qui conduit à la nécessité de développer des outils permettant de retrouver efficacement de l’information pertinente. Les systèmes de recherche actuels montrent aujourd’hui leurs limites en raison de l’absence de sémantique. Une voie qui semble intéressante à explo...

متن کامل

Une Architecture Basée Agents Mobiles Pour la Recherche d'Information dans des Sources Hétérogènes et Réparties

Résumé. De nos jours le besoin en information devient très exigeant et l'interopérabilité des systèmes devient une approche incontournable. Une demande d'information peut être répartie sur plusieurs systèmes répartis d'où la nécessité d'une reconstitution de la réponse par une entité gérante. D'autre part, les échanges des données et la répartition des tâches d'une application distribuée nécess...

متن کامل

Top_keywords : agrégation de mots-clefs dans un environnement d'analyse en ligne (OLAP)

Résumé. Depuis plus d’une décennie, les travaux de recherche sur OLAP et les bases de données multidimensionnelles ont produit des méthodes, des outils et des moyens d’analyse de données numériques. L’accroissement de la disponibilité des documents numériques entraîne un besoin pour l’ajout de documents XML principalement constitués de données textuelles au sein de bases de données multidimensi...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2017